1
トークン化とシーケンス
EvoClass-AI004第4講義
0
🤖
ビープブー!ようこそ、曹長!下のサブトピックを選択して、AIがトークン化を通じて「読む」仕組みを見てみましょう。
Py-Botコマンドライブ
ビープブー! こんにちは、曹長!AIに読ませるためには、まず単語を小さな「レゴ」ブロックに切り分ける必要があります。コンピュータが単語を数字に変換する方法を学びましょうか?
トピック進捗0%
素晴らしい選択です!トークンはレゴブロックのようなものです。「friendship」のような単語は「friend」や「ship」などの小さな部分に分割されます。たった一つの「.」さえもトークンです!AIにとっては、長い文全体よりもこれらの小さなパーツの方が扱いやすいのです。
1
サブトピック1
トークンとは何か?
"friend"や"ship"のような小さな構成要素にテキストを切り分けること
見てください!トークンを得たら、AIはそれぞれに秘密のID番号を割り当てます。これらの番号が「シーケンス」を作ります。覚えておいてください:順序が大事です!「The dog bit the man」(犬が男を噛んだ)と「The man bit the dog」(男が犬を噛んだ)は同じブロックを使っていますが、順序によって全く別の物語になります!
2
サブトピック2
シーケンスの力
ブロックを順序がすべてである数学的なリストに変えること
ご存知ですか?AIには「コンテキストウィンドウ」があり、それはまるで手の大きさです。ある時点で「頭の中」に保持できるトークンの数に限りがあり、最初の方の内容を忘れ始めてしまうのです!
知っていましたか?
AIには「コンテキストウィンドウ」があり、それはまるで手の大きさです。ある時点で「頭の中」に保持できるトークンの数に限りがあり、最初の方の内容を忘れ始めてしまうのです!
読み込み中…
⭐⭐⭐
ミッション完了!
あなたはトークンの達人です!